dataset

在网页运行Gemma 3 270M

认识一下 Gemma 3 270M——一款来自 Google 的小型但功能惊人的开源模型。它是 Gemma 系列的一部分,该系列本质上将 Gemini 模型中使用的相同技术融入了轻量级、可定制的形式。

表情符号 const gemma dataset expli 2025-10-19 05:44  3

五分钟讲解什么是lora 笔记

gpt 主模型会输出语言,但这时候我想要训练他讲火星文,原模型的 w 参数矩阵是很大的,所以这时候我要想办法更新的时候不用这么大矩阵都更新。那就想局部矩阵用来更新就好,我们把原参数固定 w0,现在训练的参数 w=w0+ w1。

gpt lora dataset 火星文 lora笔记 2025-08-22 20:01  3

解决语义搜索痛点,基于对比学习的领域特定文本嵌入模型微调实践

文本嵌入模型能够将文本转换为具有语义意义的向量表示,广泛应用于检索、分类等多种任务场景。然而,通用嵌入模型在处理特定领域任务时往往存在性能瓶颈。微调技术为解决这一问题提供了有效途径。本文将深入探讨嵌入模型微调的核心原理,并以AI职位匹配为例,详细阐述基于对比学

搜索 模型 df 语义 dataset 2025-06-25 10:15  9

【免费数据】1980-2022年中国2384个站点的水质数据

是生命之源,关乎着地球上每一个生物的生存与发展。健康的水生生态系统维持着整个水生态的平衡与活力;更是确保人类能持续获得清洁水源的重要保障。水质数据在水质研究、海洋生物量测算以及生物多样性评估等诸多关键领域都扮演着举足轻重的角色。

免费 水质 shp zhou dataset 2025-06-04 22:33  14

看完这篇别再说自己不懂data project了

✓ 填补简历上的时间 Gap• 如果简历上一个暑假没有 Intern 经历(尤其是毕业前的一个暑假),有些 ATS会标记这个时间为 Unemployed,HR 也可能会在面试时问你这个暑假在做什么。• 如果没有找到 Summer Intern 或暑假出去玩了,

i notebook dataproject dataset 2025-06-03 23:34  15